导读:搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?先说下Kyw认为的搜索引擎运作过程的前几个步骤:1. 蜘蛛下载A页面,送回服务器;2. 服务器寻找A页
发表日期:2019-11-27
文章编辑:兴田科技
浏览次数:10165
标签:
搜索引擎蜘蛛把页面代码送回搜索引擎服务器后,SE是如何判断页面中最核心的内容呢?
先说下Kyw认为的搜索引擎运作过程的前几个步骤:
1. 蜘蛛下载A页面,送回服务器;
2. 服务器寻找A页面的核心内容位置,然后去除HTML代码;
3. 寻找网页核心内容;……
我不确定GOOGLE、百度、YAHOO!是否真的有“判断核心内容”这个步骤,但我相信一定有类似的运算机制,因为如果没这个步骤,搜索引擎将耗费大量资源做重复运算。当然KYW不是搜索引擎工程师,下面只是对搜索引擎的一些思考。
SE面对一整页HTML代码,如何判断核心内容在哪里呢?
第一步:拿该页面和同域名、同目录、同文件名格式的页面做对比,去除相似的部分。经过这个步骤,头部的导航条、底部的版权信息、固定位置的广告就被去掉了。我估计搜索引擎在每增加一个新网站的时候,会建立一个对比模板来提高工作效率。如果网站经常改版,在改版刚开始的期间,搜索引擎还没反应过来,就可能造成新收录网页的排名不理想。
第二步:去掉有大量链接的部分。经过这步,“相关文章”“推荐文章”等都被去掉了,剩下一些包含文字内容的代码。
第三步:在剩余的代码中判断哪段标签(可能是p、TABLE、p或其它标签)中的文字内容最多,因为一般核心内容的文字量会比较多。
每个页面经过上面3个步骤,应该就能顺利的判断出核心内容所在的位置。经过这样的思考,我们也许可以这样总结:
1. 同目录下的页面,最好模板一样。
2. 核心内容文字量不能太少,特别是企业站和B2C网站,只放价格和包含大量说明文字的图片是很不好的。
3. HTML代码中如果错误很多,可能会影响排名,因为搜索引擎可能在判断核心内容的时候出差错。
4. 期待你的补充 ^_^
Kyw把SEO的主要工作理解成帮助搜索引擎更高效的理解网站及页面的内容,所以建议大家有事没事琢磨琢磨搜索引擎,问题想透的越多,SEO的手法也就更加随机应变了。当然也没必要钻牛角尖,有想不通的问题就到我这留言吧。
原文:http://www.seotest.cn/blog/se-panduan-hexin.html
上一篇:
大连网站建设怎样写客户需要的内容呢?上一篇:
与搜索引擎交朋友更多新闻
2023
什么是建设网站费用?在建设一个网站之前,了解和计划费用是至关重要的。。建设网站的费用包括网站设计、开...
View details
2023
丹东网站建设公司拥有经验丰富的团队成员,他们了解最新的技术趋势和行业最佳实践。他们可以根据您的业务需求,为您提供专业的建议和解决方案。无论您需要一个简单的静态网站还是一个复杂的电子商务平台,他们都能根据您的要求进行定制开发。
View details
2023
随着科技的迅猛发展和移动设备的普及,手机应用程序已经成为人们日常生活中不可或缺的一部分。人们可以通过手机应用程序轻松地购物、预定服务、社交娱乐等。而小程序作为一种新兴的应用形式,正在迅速流行起来。本文将重点介绍定制小程序开发的概念、优势以及如何在市场中成功运营定制小程序。
View details
2023
引言在如今数字化的时代,拥有一个靠谱的商城网站对于企业来说是至关重要的。。随着电子商务的兴起,越来越...
View details